import re
import commands

def leMensagens():
   # Obtem nomes dos arquivos que estao na pasta caminho_pasta
   lista_arqs = commands.getstatusoutput('ls ../messages/')
   lista_arqs = lista_arqs[1].split('\n')
   print('Lendo mensagens...')
   mensagens=[]
   num_arquivos=0
   for nome_arq in lista_arqs:
      num_arquivos+=1 # Incrementa numero de arquivos lidos para verificar se o numero total esta correto.
      arq=open('../messages/' + nome_arq) # Abre mensagens.
      conteudo_arq = arq.read()
      conteudo_arq = conteudo_arq.split('Subject')[1:] # Ignora tudo o que estiver escrito ate subject
      conteudo_arq = ' '.join(conteudo_arq).lower()
      conteudo_arq = re.findall(r"[\w']+",conteudo_arq) # Da um split no conteudo do arquivo, removendo pontuacao.
      mensagens.append(conteudo_arq)
      arq.close()
   print('Numero de arquivos lidos: ' + str(num_arquivos))
   #print(mensagens)
   return(mensagens)

